##设置工作空间
#把“数据及程序”文件夹拷贝到F盘下，再用setwd设置工作空间
#读入数据
saledata=read.csv(file="./data/catering_sale.csv",header=TRUE) 

# 缺失值检测 并打印结果，由于R把TRUE和FALSE分别当作1、0，可以用sum()和mean()函数来分别获取缺失样本数、缺失比例
a <- sum(complete.cases(saledata))
print(a)
b <- sum(!complete.cases(saledata))
print(b)
print(mean(!complete.cases(saledata)))
print(saledata[!complete.cases(saledata),])
print(saledata[complete.cases(saledata),])
# 异常值检测箱线图
sp=boxplot(saledata$"销量",boxwex=0.5)
title("xxx")
xi=1.04
sd.s=sd(saledata[complete.cases(saledata),]$"销量")
mn.s=mean(saledata[complete.cases(saledata),]$"销量")
points(xi,mn.s,col="pink",pch=18)
arrows(xi, mn.s - sd.s, xi, mn.s + sd.s, code = 3, col = "blue", angle = 75, length = .1)
text(rep(c(1.05,1.05,0.95,0.95),length=length(sp$out)),labels=sp$out[order(sp$out)],
     sp$out[order(sp$out)]+rep(c(150,-150,150,-150),length=length(sp$out)),col="pink")

